{% extends "root/_incs/lay_root.htm" %}

{% block title %}<title>爬虫 - {{ g.sys['title']}}</title>{% endblock %}

{% block head %}
    <h1>爬虫简介</h1>
    <p>爬风景，爬美女，爬链接，专业爬…</p>
{% endblock %}

{% block main %}

<div class="out">

<div class="in">
    <h2><span class="tg1">爬,不是偷窃！</span>尊重版权,分享技术</h2>
    <div>
        <p>* 爬，不是偷窃！“尊重版权，分享技术”：仅此而已！</p>
        <p>* 生活是艰难的：甚至需要爬……</p>
        <p>* 但在这里，爬网页，爬知识，是有乐趣的：缓存网页结果，类似jQuery选择器取资料，多进程执行(折腾中)……</p>
        <p>* 我怎么感觉，这个`理论`与“人生苦短，我用Python”非常接近？？？</p>
    </div>
</div>

<div class="in">
    <h2><span class="tg1">简单采集</span>小试牛刀</h2>
    <div>
        <p>* 
            <a href="./pa-pic?wd=清新早晨">爬风景（图片）</a>，
            <a href="./pa-pic?wd=清纯美女">爬美女（图片）</a>，
            <a href="./pa-pic?wd=动物世界">动物世界</a>，
            <a href="./pa-pic?wd=花鸟壁纸">花鸟壁纸</a>，
            <a href="./pa-pic">baidu图片</a>，
            <a href="./pa-nip">nipic图</a>……
        </p>
        <p>* <a href="./pa-link">爬链接</a>：自动搜索关键字，自动打开这些链接；为SEO？？？</p>

        <p>* <a href="./pa-diy">DIY爬</a>：自定义采集页面元素，我怎么感觉在用JQ？对，这里用PyQuery！</p>
    </div>
</div>

<div class="in">
    <h2><span class="tg1">某网站</span>专业采集</h2>
    <div>
        <p><a href="./cj">* 专业采集某网站</a>：类别（地区等），信息列表，信息详情，关联图片……</p>
    </div>
</div>

<div class="in">
    <h2><span class="tg1">ReadMe</span>申明</h2>
    <div>
        <p>* 所有爬取的图片文字等资源，版权等属于目标网站或原版权所有者；
            这里，仅为演示功能，分享技术！</p>
        <p>* 您若在意（爬您图片）：请联系 xpigeon#163.com，3工作日内屏蔽；</p>
        <p>* 您若使用（本系统）采集东西：欢迎切磋；但请同时尊重（被采集方的）版权，合法使用！</p>
        <p>* 多进程：放在Flask中，总出问题(折腾中)……感谢指点！</p>
    </div>
</div>

</div><!--end.out-->

{% endblock %}
